Vorige week is door Splunk een onderzoek naar buiten gebracht, waarbij een van de bevindingen is dat er 2025 tot vijf keer meer data zal worden opgeslagen dan nu het geval is. Als die voorspelling uitkomt is dat heel goed nieuws voor Splunk dat oplossingen voor het beheer en de omgang met big data levert. Maar klopt het onderzoek wel?
Groot onderzoek
Het onderzoek waar Splunk mee komt is door een derde partij uitgevoerd. Dat heeft ruim 2.200 “Business and IT Leaders” uit meerdere landen de vragen voorgelegd. Het onderzoek is daarom groot en breed genoeg om serieus genomen te worden.
In deze groep is twee derde van mening dat de hoeveelheid data tot 2025 met factor vijf kan toenemen. De reden waarom dat is loopt uiteen, maar iedereen is wel van mening dat data in principe waardevol is.
Wat voor data
De vraag om wat voor data het hier gaat minder duidelijk. Een even grote groep (66 procent) is namelijk van mening dat op dit moment meer dan de helft van de data binnen de organisatie niet inzichtelijk is. Het begrip dat Splunk en anderen hiervoor hanteren is dark data. Dat moet onderzocht, geanalyseerd en gerubriceerd worden. Toevallig is dat een van de kerncompetenties van Splunk.
Instroom van data
De te nemen stappen zouden ook helpen de instroom van nieuwe data in bedrijven beter te managen. Met merendeel van de deelnemers aan de enquête geeft aan daar behoefte aan te hebben. Zij schatten in dat het tempo en volume van die instroom hoger is dan de organisatie aan kan. Dat belooft nog wat als AI, IoT en 5G echt grootschalig worden ingezet
Te kort schieten
Op dit punt schieten het onderzoek en de rapportage echter te kort. Nergens wordt gewezen op een belangrijke wettelijk beperking. De AVG schrijft data minimalisatie voor. Vergelijkbare regels en begrippen zijn ook in andere landen van toepassing. Vragen over de impact van de AVG en bijvoorbeeld CCPA zijn niet terug te vinden in communicatie over het bericht.
Voor iedereen die bezig is met security is het goed te zien wat een deel van de business verwacht voor de komende jaren. Het onderzoek is wat dat betreft een goed startpunt voor een discussie. Meer data creëren en vergaren is een ding. Zorgen dat niet alle data voor onbekende duur en ongedocumenteerd wordt opgeslagen is iets dat ook permanent aandacht verdient.